Seminario de Estadística 2018

Lunes 7 de mayo a las 12 hs.

Instituto de Cálculo FCEyN-UBA

Gonzalo Chebi (FCEyN, UBA - CONICET).

Regresión logística robusta en alta dimensión.

La regresión logística es un problema ampliamente estudiado en la literatura y es una de las principales herramientas para clasificación. Para controlar la influencia de outliers, Bianco y Yohai propusieron una versión robusta del estimador de máxima verosimilitud. Sin embargo, este método sólo resulta eficiente en el caso en que la dimensión sea baja. El
desarrollo de teconologías en diversas áreas de la ciencia aumentó sustancialmente la capacidad de obtener, guardar y procesar datos. Esto trae nuevos desafíos desde el punto de vista estadístico. En particular, es muy común trabajar con conjuntos de datos en donde la dimensión es alta.
En este trabajo adaptamos los estimadores de Bianco y Yohai para que sean eficientes también en el caso de alta dimensión. Al suponer que el vector de coeficientes de regresión es ralo, una estrategia muy común es imponer una penalización en el problema a minimizar. Vamos a comparar algunas penalizaciones famosas en la literatura y vamos a introducir la llamada penalización signo, que tiene la ventaja de seleccionar variables sin achicar innecesariamente los parámetros estimados. Vamos a mostrar propiedades asintóticas de estos estimadores, tanto en el caso donde la dimensión es fija, como en el caso en que la dimensión tiende a infinito junto con el tamaño de muestra. Finalmente, vamos a mostrar los resultados de una simulación que compara empíricamente la efectividad de nuestros estimadores en escenarios contaminados y sin contaminar. Trabajo en proceso conjunto con Ana Bianco y Graciela Boente.